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AIGC 语言 模型 分 析 及 其 高 校 图 书馆 应 用 场景 研究 


FRR '， 杨 小 华 ? 
(1. 广西 师范 大 学 图 书馆 ， 桂 林 541004; 2. 广西 师范 大 学 生命 科学 学 院 ， 桂 林 541004) 


fi ”要 : [目的 /意义 ]AIGC 的 内 容 创作 方式 给 图 书 情报 领域 带 来 一 场 新 的 变革 。 对 比分 析 AIGC 大 语言 模型 的 优 缺 点 ， 探 讨 
AIGC 的 运行 机 制 ， 深 入 研究 高 校 图 书馆 场景 下 的 应 用 方案 ， 为 智慧 图 书馆 AIGC 应 用 选 型 提供 窑 新 的 思路 。[ 方 法 / 过 程 ] 以 
ChatGPT、 文 心 一 言 和 Bard 三 项 AICC 应 用 为 例 ， 运 用 比较 分 析 法 进行 横向 对 比 研究 ， 归 纳 总 结 出 AIGC 的 6 个 共同 特征 和 9 
个 差异 特征 ， 提 炼 出 高 校 图 书馆 6 个 应 用 场景 模式 ， 探 讨 可 能 面临 的 4 个 潜在 风险 问题 ， 并 提出 降低 风险 的 对 策 。 [结果 / 结 
论 ] 研 究 结 果 表 明 ，ChatGPT 更 适合 在 高 校 图 书馆 的 知识 服务 、 学 科 服 务 和 行政 管理 等 场景 中 进行 资源 整合 和 决策 辅助 。 文 心 
言 更 适合 在 高 校 图 书馆 读者 服务 、 技 术 服务 和 文化 服务 等 场景 中 优化 服务 和 辅助 创作 。Bard 更 适合 在 高 校 图 书馆 参考 咨询 
场景 中 辅助 知识 问答 。 采 用 AIGC 应 用 ， 高 校 图 书馆 尽管 会 面临 伦理 风险 、 隐 私 风 险 、 数 据 安 全 和 虚假 知识 泛滥 等 问题 ， 但 更 
能 优化 服务 环境 ， 提 升 智慧 化 服务 水 平 。 
关键 词 : ChatGPT; 文 心 一 言 ; Bard; AIGC; 智慧 
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化 -智慧 化 ”建设 道路 上 迈进 一 大 步 。OpenAI 公司 的 
ChatGPT 、 百 度 公司 的 文 心 一 言 和 Google 公司 的 Bard 
是 目前 世界 上 主流 的 三 大 生成 式 对话 系 统 ， 都 能 与 用 

近年 来 ， 人 工 智 能 应 用 席卷 全 球 。 人 工 智 能 生成 “” 户 通过 自然 语言 进行 人 机 交互 ， 作 为 人 工 智 能 生成 内 
内 容 (Artificial Intelligence Generated Content， 简 称 容 应 用 的 先驱 ， 为 图 书馆 在 智慧 化 组 织 、 管 理 和 服务 
AIGC) 作为 其 中 的 佼佼 者 为 人 类 社会 的 生产 生活 方式 。 等 方面 带 来 全 新 的 视野 和 挑战 。ChatGPT、 文 心 一 言 和 
带 来 一 场 悄 然 的 变革 ， 成 为 人 工 智能 革命 一 股 不 可 或 Bard 的 系统 架构 和 技术 路 线 各 有 不 同 ， 解 构 各 系统 模 
缺 的 力量 。 智 慧 图 书馆 建设 离 不 开 人 工 智 能 技术 的 文 “型 并 分 析 其 异同 ， 研 究 高 校 图 书馆 中 的 应 用 场景 模式 ， 
撑 ，AIGC 应 用 的 发 展 引领 着 图 书馆 在 “信息 化 - 智能 ”能 为 图 书馆 AIGC 应 用 选 型 提供 轩 新 的 思路 。 
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2 国内 外 研究 现状 


2022 年 11 H, ChatGPT (ChatGenerativePre-trained 
Transformer， 聊 天 生成 预 训练 转换 器 ) 全 球 发 布 ， 标 
志 着 人 工 智 能 应 用 进入 快速 增长 期 ，AIGC 迎 来 新 的 时 
RO, RGA ChatGPT 发 布 ，2023 年 3 月 ， 文 心 一 言 
和 Bard 相继 上 线 ， 拉 开 AIGC SRE ZARA HER, TE 
为 AIGC 的 新 兴 产 品 ，ChatGPT、 文 心 一 言 和 Bard 基于 
大 语言 模型 研发 ， 能 够 与 用 户 进 行 自然 语言 互动 交流 ， 
自动 生成 文本 和 内 容 摘要 ， 帮 助人 们 获取 知识 和 灵感 。 

截至 2023 年 7 月 31 日 ,在 Wos 核心 合集 上 以 
“TS=(ChatGPT) OR TS=("ERNIE bot") OR TS= (Bard) 
OR TS=(AIGC) OR TS=("Large Language Model")” 为 检 
索 式 进行 主题 检索 ， 并 限定 文献 类 型 为 “论文 ” ， 共 获 
得 290 条 检索 结果 ， 关 键 词 聚 类 结果 如 图 1 所 示 。 在 
CNKI 上 以 “(主题 =ChatGPT) OR (主题 = 文 心 一 言 
OR (主题 =Bard) OR (主题 =LLM) OR (主题 =AIGC) 
OR (主题 = 大 语言 模型 )” 为 检索 式 进行 主题 检索 ， 并 
限定 文献 类 型 为 “学 术 期 刊 "， 共 获得 1 135 条 检索 结 
果 ， 其 中 ，“ 图 书 情报 与 数字 图 书馆 ”学 科 分 类 上 有 


f 


nip 


medical education Í 


artificia | 
Baer N j ps | 


students 


Da et ta 
_ research. ~ 
7, 


assessment 


internet generative anc intellig Zz 


~ openai 


artificial-ifttelligence 


information 


elligence 


natural langage protessing 


artificial intelligence (ai) 


48 篇 ， 关 键 词 聚 类 结果 如 图 2 所 示 。 

从 检索 结果 来 看 ， 中 国 更 注重 AIGC 应 用 研究 。 
涉及 关键 词 “ChatGPT” 的 学 术 论 文 最 早 由 卢 卫 红 和 杨 
新 福 发 表 ， 文 章 从 哲学 角度 研究 ChatGPT 人 工 智能 
带 来 的 “思维 革命 "， 为 AIGC 应 用 研究 进行 了 前 期 探 
索 。 自 2023 年 1 月 起 ，ChatGPT 研究 出 现 猛 增 , 表明 
AIGC 研究 在 中 国 呈 快速 增长 的 态势 。 从 聚 类 分 析 来 
看 ， 国 内 外 都 是 以 “ChatGPT” 为 主要 研究 对 象 ， 国 外 
更 倾向 于 人 工 智能 、 自 然 语言 处 理 、 大 语言 模型 、 聊 
天 机 器 人 等 模型 和 算法 的 基础 研究 ， 国 内 更 倾向 于 生 
成 式 人 工 智 能 、 学 术 伦理 、 应 用 场景 、 教 育 数字 化 转 
型 等 人 文 关系 和 社会 问题 的 应 用 研究 。 图 书 情 报 领域 
主要 从 宏观 角度 研究 ChatGPT 对 图 书馆 智慧 服务 的 影 
响 、 对 策 和 应 用 场景 ， 并 对 图 书馆 未 来 的 发 展 道路 提 
出 建设 性 意见 中。 国内 外 研究 都 以 AIGC 和 ChatGPT 
为 主 ， 而 文 心 一 言 和 Bard 研究 较 少 。 


3 AIGC 大 语言 模型 系统 分 析 


人 工 智能 生成 内 容 (AGC 白皮书 认为 : 
“AIGC 既是 从 内 容 生 产 者 视角 进行 分 类 的 一 类 内 容 ， 
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图 1 Wos 核心 合集 关键 词 聚 类 分 析 图 


Fig.1 Keywords' cluster analysis of papers downloaded from WoS core collection database 
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又 是 一 种 内 容 生产 方式 ， 还 是 用 于 内 容 自动 化 生成 的 
一 类 技术 集合 。M ”ChatGPT、 文 心 一 言 和 Bard 作为 
AIGC 的 实际 产品 证 明 人 工 智 能 算法 具有 智能 数字 内 容 
创作 和 自我 演化 的 能 力 ， 都 同时 具备 可 持续 性 、 可 创 
造 性 和 实时 性 等 特征 ， 也 拥有 各 自 不 同 的 特点 ， 可 适 
用 于 高 校 图 书馆 不 同 服务 场景 。 


3.1 各 系统 共同 性 特征 


Transformer 模型 是 Google 于 2017 年 提出 的 人 工 
智能 机 器 学 习 模型 ， 主 要 用 于 自然 语言 理解 处 理 任 务 , 
其 最 大 特点 就 是 采用 自 注 意 力 机 制 解析 语言 中 各 部 分 


risk regulation © 
ficial intellig 
(gm ewe 


FRE, th) te 
AIGC 语言 模型 分 析 及 其 高 校 图 书馆 应 用 场景 研究 


机 过 每 挑战 
AT RETR 


Transformer 模型 的 基础 上 分 别 演 化 形成 的 ， 因 此 具有 
以 下 共同 特征 : 巴 都 有 并 行 化 处 理 能 力 。 模 型 采用 自 
注意 力 机 制 ， 不 依赖 前 一 步骤 的 处 理 结果 ， 只 依赖 于 
输入 向 量 ， 因 此 可 以 实现 完全 并 行 计算 ， 提 高 自然 语 
言 处 理 速度 。 包 都 有 长 文本 增强 处 理 能 力 。 模 型 优化 
位 置 编码 ， 能 从 全 局 直接 计算 两 个 词 之 间 的 依赖 关系 ， 
不 容易 出 现 梯度 消失 和 爆炸 的 问题 ， 更 好 的 处 理 长 文 
本 内 容 。 加 都 有 多 语言 、 多 任务 扩展 能 力 。 采 用 
Transformer 模型 能 够 根据 具体 任务 的 需要 自由 调整 层 
数 、 注 意 力 层 的 头 数 等 参数 ， 扩 展 模 型 的 适用 范围 。 
由 都 有 预 训练 学 习 优化 过 程 。 模 型 无 需 进 行 特征 工程 ， 


MIA", BES Transformer 包含 编码 器 和 解码 器 两 个 
部 分 ， 可 任 选 其 中 某 一 部 分 或 多 个 部 分 经 过 多 重组 合 
形成 新 的 大 语言 模型 。Transformer 模型 的 整体 架构 如 
图 3 所 示 。 

ChatGPT、 文 心 一 言 和 Bard 都 实现 了 自然 语言 理 
解 分 析 和 文本 内 容 自 动 生成 ， 能 够 以 自然 语言 与 用 户 
对 话 ， 实 时 响应 用 户 提问 ， 提 供 智 能 对 话 服务 。 虽 然 
各 系统 拥有 不 同 的 语言 模型 ， 但 这 些 语 言 模型 都 是 在 


可 直接 处 理 原始 数据 ,减少 人 工 干 预 成 本 ， 提 高 模型 
训练 效率 。 回 都 有 多 模 态 数据 强化 处 理 能 力 。 通 过 对 
模型 的 微调 ， 能 够 实现 文本 、 图 像 、 音 频 、 视 频 等 多 
模 态 数据 的 融合 ， 提 高 模型 的 表征 能 力 。@ 都 有 泛 化 
迁移 学 习 能 力 。 通 过 在 大 数据 上 进行 预 训练 ， 再 根据 
任务 的 实际 需要 对 模型 参数 进行 微调 ， 可 实现 模型 的 
迁移 学 习 。 


这 些 特征 有 利于 高 校 图 书馆 加 速 融 合 学 科 知 识 
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图 3 Transformer 模型 整体 架构 图 


Fig.3 Transformer model overall structure 


教学 资源 ， 扩 展 知识 服务 边界 ， 优 化 技术 服务 方式 ，” 标 并 不 相同 。ChatGPT 更 偏向 文本 内 容 自动 生成 ， 文 
丰富 文化 服务 内 容 ， 提 升 智慧 服务 水 平 。 心 一 言 侧重 于 多 模 态 数据 的 创作 融合 ，Bard 更 关注 自 
32 各 系统 差异 性 特征 Bae 因此 具有 各 自 的 特点 。 其 特征 如 表 1 
PZR o 
3.2.1 语言 模型 架构 

ChatGPT 基于 GPT (Generative Pre-trained Trans- 


ChatGPT 、 文 心 一 言 和 Bard 都 是 在 Transformer 模 
型 的 基础 上 建立 起 的 AIGC 应 用 ， 但 各 系统 的 任务 目 


表 1 ChatGPT、 文 心 一 言 、Bard 特征 分 析 表 
Table 1 Comparison offeatures of ChatGPT, ERNIE Bot and Bard 


项 ChatGPT 文 心 一 言 Bard 
运营 公司 OpenAI 公司 百度 公司 Google 公司 
语言 模型 GPT ERNIE LaMDA 
预 训练 参数 / 亿 1750 2 600 1370 
预 训练 数据 量 /TB 45 4 1.56 
训练 数据 类 型 互联 网 文本 数据 互联 网 多 模 态 数据 文本 对 话 数据 
数据 来 源 2021 年 9 月 以 前 互联 网 历史 文本 数据 互联 网 实时 搜索 、 图 像 、 语 音 、 事 实数 据 互联 网 网 页 实时 数据 
语言 支持 多 种 语言 ， 自 然 语言 中 文 ， 自 然 语 言 仅 英文 ， 对 话 应 答 
模 态 支持 单 模 态 ， 文 本 多 模 态 ， 文 本 、 图 像 单 模 态 ， 仅 文本 对 话 
任务 适用 性 通用 领域 任务 通用 领域 任务 人 机 对 话 任务 
应 用 场景 9 然 语 言 理解 ， 文 本 生成 ， 语 言 翻译 ， 文 ”自然 语言 文本 创作 , 图 像 生 成 、 语 言 翻 译 、 ”自然 语言 问答 ,文本 生成 ， 语 
本 摘要 ， 代 码 生成 尺码 生成 言 翻译 
可 使 用 地 域 全 球 中 国 美国 、 英 国 
跨 语言 迁移 能 力 具备 弱 前 无 
可 扩展 性 具备 具备 具备 
可 解释 性 相对 较 弱 相对 较 高 相对 较 弱 
局 限 性 知识 有 限 ， 真 实 性 无 法 保障 中 文 表现 显著 ， 英 文 表现 能 力 较 弱 训练 数据 较 少 ， 不 支持 多 语 


言 ， 有 时 提供 多 个 答案 
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former， 生 成 式 预 训练 转换 器 ) 大 语言 模型 构建 ， 新 增 
反馈 强化 学 习 (Reinforcement Learning from Human 
Feedback， 简 称 RLHF) 过 程 ， 用 于 增强 对 输出 结果 的 
智能 调节 ， 提 高 语言 模型 的 识别 能 力 ， 具 有 良好 的 文 
本 生成 和 泛 化 扩充 性 能 外， 其 模型 结构 如 图 4 所 示 。 
GPT 模型 仅 使 用 Transformer 模型 中 的 解码 器 ， 并 
只 保留 掩 码 多 头 注意 力 层 部 分 ， 提 高 模型 训练 速度 。 
经 过 3 个 版 本 的 迭代 开发 ， 利 用 并 行 计算 的 优势 ，GPT 
模型 在 自然 语言 理解 任务 中 表现 出 章 越 的 性 能 中 
ChatGPT 至 少 采 用 96 层 Transformer 用 于 大 数据 训练 ， 
同时 引入 评估 式 强 化 人 工 训练 代理 (Training an Agent 
Manually via Evaluative Reinforcement， 简 称 TAMER) 
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对 学 习 结 果 进 行人 工 标注 ， 采 用 真实 性 、 无 害 性 和 有 
用 性 评价 标准 对 输出 结果 进行 评价 并 提供 奖励 反馈 ， 
达到 快速 收敛 和 完成 训练 任务 的 目标 。 

文 心 一 言 基 于 ERNIE (Enhanced Representation 
through Knowledge Integration， 信 息 实 体 增强 语言 
示 ) 大 语言 模型 构建 ， 融 合 大 数据 知识 图 谱 与 文本 数 
据 进 行 混 合 训练 ， 提 升 语言 模型 创作 能 力 上 四， 其 模型 
结构 如 图 5 所 示 。 

ERNIE 模型 仅 使 用 Transformer 模型 中 的 编码 器 ， 
在 其 基础 上 舰 入 知识 图 谱 ， 并 加 入 连续 学 习 流 程 ， 将 
预 训 练 网 络 分 为 48 层 通用 语义 表示 网 络 和 12 层 任 务 语 
义 表 示 网 络 ， 提 高 多 任务 训练 的 灵活 性 和 扩展 性 be。 文 


图 4 GPT 模型 结构 图 


Fig.4 GPT model structure 
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心 一 言 作为 ERNIE 模型 的 典型 应 用 ， 通 过 多 模 态 数据 
预 训练 ， 增 强 跨 模 态 语义 理解 能 力 ， 能 够 应 用 到 文本 
创作 、 图 像 设计 等 多 模 态 场景 中 。 

Bard 基于 LaMDA ( Language Models for Dialog 
Applications， 对 话 应 用 语言 模型 ) 大 语言 模型 构建 


时 数据 和 对 话 数据 为 主 ， 数 据 量 达 1.56TB， 预 训练 参 
数 达 1370 亿 ， 数 据 规模 是 3 个 系统 中 最 小 的 。 

3 个 系统 都 采用 无 监督 学 习 进 行 预 训练 ， 通 过 自 回 
归 和 自 编码 生成 任务 学 习 语 言 模型 ， 采 用 奖励 模型 对 
参数 进行 微调 以 适应 各 类 下 游 任务 。ChatGPT 依赖 大 


专门 训练 人 类 对 话 数 据 ， 产 生 类 似 自 然 语言 的 反馈 响 
应 ,为 人 们 学 习 交 流 提供 帮助 外， 其 模型 结构 如 图 6 
所 示 。 

LaMDA 模型 仅 使 用 Transformer 模型 中 的 解码 器 ， 
将 外 部 知识 舰 入 到 64 JE Transformer 中 ， 并 对 生成 的 
识别 结果 用 质量 性 、 安 全 性 和 可 靠 性 3 项 标准 进行 量 
化 评分 ,综合 评分 决定 生成 的 响应 是 否 需 要 重新 训练 ， 
最 终 提高 人 机 问答 质量 四。 

总 体 来 看 ，ChatGPT 具有 更 强 的 自然 语言 理解 能 
力 ， 更 适合 为 高 校 图 书馆 知识 服务 提供 辅助 。 文 心 一 
言 具 有 多 模 态 数据 生成 能 力 ， 更 适合 高 校 图 书馆 内 容 
创作 和 数据 可 视 化 分 析 。Bard 具有 增强 人 机 对 话 能 
更 适合 应 用 于 高 校 图 书馆 的 参考 咨询 和 智能 问答 服务 
场景 中 。 

3.2.2 预 训练 数据 策略 

ChatGPT 预 训练 数据 以 文本 数据 为 主 ， 是 2021 年 
9 月 以 前 采集 到 的 互联 网 历史 数据 ， 数 据 量 达 45TB， 
训练 参数 达 1 750 亿 ， 数 据 规 模 是 3 个 系统 中 最 大 的 。 
文 心 一 言 预 训练 数据 以 多 模 态 数据 为 主 ， 包 括 互联 网 
实时 搜索 、 图 像 、 语 音 、 事 实 等 数据 ， 数 据 量 达 4TB， 
预 训 练 参数 达 2 600 亿 。Bard 预 训练 数据 以 互联 网 实 
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量 文 本 数据 训练 和 人 工 标 引 奖 励 机 制 获得 最 佳 自然 语 
言 理解 能 力 ， 能 够 生成 人 类 无 法 区 别 的 AI 内 容 ， 但 由 
于 都 是 历史 数据 ， 因 此 不 能 准确 响应 2021 年 9 月 以 后 
发 生 的 事件 。 文 心 一 言 和 Bard 都 是 采用 实时 数据 进行 
训练 ， 具有 较 强 的 数据 优势 。 文 心 一 言 采用 持续 学 习 
和 知识 燕 馏 技 术 ， 训 练 过 程 中 融合 知识 图 谱 ， 提 升 模 
型 处 理 多 模 态 数据 知识 的 能 力 。Bard 采用 量化 评分 机 
制 对 训练 结果 进行 评价 ， 提 高 问题 反馈 的 中 立 性 。 相 
比 而 言 ， 文 心 一 言 有 更 强 的 知识 学 习 和 拓展 能 力 ， 能 
更 好 的 提升 高 校 图 书馆 知识 服务 效果 。 
3.2.3 任务 适用 性 
ChatGPT 在 多 个 领域 应 用 中 取得 显著 成 果 ， 由 于 
其 较 强 的 自然 语言 理解 和 生成 能 力 ， 在 知识 问答 、 对 
话 生 成 、 文 本 摘要 、 阅 读 理解 、 情 感 分 析 等 领域 表现 
出 卓越 的 效果 。 尤 其 是 人 机 对 话 应 用 上 ， 生 成 内 容 非 
常 接近 人 类 自然 语言 ， 并 能 辅助 用 户 完成 一 些 复 杂 的 
文字 工作 。 文 心 一 言 拥 有 多 模 态 训练 模型 的 先天 优势 ， 
除了 ChatGPT 的 文本 交互 功能 外 ， 还 能 进行 命名 实体 
识别 ， 根 据 用 户 的 文本 描述 生成 虚构 图 像 设计 ， 辅 助 
设计 行业 进行 图 像 设 计 。Bard 专注 于 人 机 对 话 应 用 ， 
旨 在 以 无 差别 的 自然 语言 与 用 户 进行 沟通 交流 ， 因 此 
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图 6 LaMDA 模型 结构 图 


Fig.6 LaMDA model structure 


2023 年 第 35 卷 第 7 期 


Fn BR FETAL i I, RAAT RETR CAM 
微调 ， 也 可 用 于 其 他 领域 行业 。 由 此 可 见 ， 文 心 一 言 
拥有 更 丰富 的 应 用 领域 ， 更 能 满足 高 校 图 书馆 多 元 化 
的 服务 需求 ， 达 到 降 本 增 效 的 目的 。 
3.2.4 语言 知识 库 

ChatGPT 以 英文 知识 为 主 ， 因 此 更 擅长 处 理 英文 
任务 ， 但 拥有 多 语言 知识 库 ， 也 可 处 理 多 语言 问答 。 
应 用 能 够 自动 识别 用 户 提问 所 使 用 的 语言 ， 并 生成 与 
用 户 语 言 一 致 的 响应 ， 也 可 以 进行 语言 翻译 ， 由 于 使 
用 自然 语言 学 习 模 型 ， 翻 译 效果 略 好 于 机 器 翻译 。 文 
心 一 言 运 营 在 中 国 ， 更 擅长 处 理 中 文 任务 ， 也 支持 英 
文 ， 但 效果 差强人意 ， 其 他 语言 则 不 支持 。 但 文 心 一 
言 能 够 不 断 更 新 知识 库 ， 在 获得 新 语言 知识 的 条 件 下 ， 
支持 多 语言 环境 不 是 问题 。Bard 目前 处 于 公测 阶段 ， 
并 不 支持 除 英文 以 外 的 其 他 语言 进行 对 话 ， 且 只 有 美 
英 地 区 才能 使 用 Bard， 有 较 大 的 限制 ， 但 其 英文 对 话 
处 理 能 力 和 应 答 反馈 效果 很 好 。 因 此 ， 文 心 一 言 更 适 
合 中 国 高 校 图 书馆 的 应 用 环境 ， 在 新 知识 不 断 积累 和 
沉淀 下 ， 服 务 质 量 会 有 更 大 提高 。 
3.2.5 跨 语言 迁移 能 力 

跨 语言 迁移 能 力 是 衡量 自然 语言 学 习 模型 适用 范 
围 的 重要 指标 。ChatGPT 拥有 多 语言 知识 库 ， 在 处 理 
英文 任务 的 基础 上 ， 能 够 实现 多 场景 、 多 任务 、 多 语 
言 的 统一 迁移 学 习 ， 表 现 出 跨 语言 迁移 能 力 。 文 心 一 
言 主要 关注 于 中 文 处 理 任务 ， 其 多 语言 知识 库 较 少 ， 
跨 语言 迁移 能 力 受到 限制 。Bard 不 接受 除 英文 外 的 其 
他 语言 进行 提问 ， 但 能 进行 语言 翻译 ， 目 前 未 表现 出 
跨 语言 迁移 能 力 。 可 以 看 出 ，ChatGPT 更 适合 为 高 校 
留学 生 提供 多 语言 学 科 服 务 ， 实 现 跨 语 言 无 缝 交流， 
吸纳 更 多 服务 对 象 ， 拓 展 学 科 服 务 范 畴 。 
3.2.6 可 解释 性 与 可 靠 性 

可 解释 性 用 于 探究 学 习 模 型 内 部 运作 过 程 ， 可 解 
释 性 越 高 ， 表 明 学 习 模 型 越 透明 ， 产 生 的 结果 越 容易 
被 人 信任 。ChatGPT 采用 大 型 语言 模型 进行 预 训练 ， 
训练 参数 多 ， 训 练 数据 量 大 ， 可 解释 性 相对 较 差 。 文 
心 一 言 使 用 知识 图 谱 和 持续 学 习 对 学 习 过 程 进行 增强 ， 
可 解释 性 相对 强 些 。Bard 训练 参数 少 ， 训 练 数据 量 小 ， 
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且 以 对 话 数据 为 主 ， 可 解释 性 更 高 。 

可 靠 性 用 于 判定 自然 语言 学 习 模 型 是 否 值 得 信任 。 
从 目前 使 用 情况 来 看 ， 无 论 ChatGPT、 文 心 一 言 还 是 
Bard 都 会 在 一 定 程 度 上 对 信息 判断 失误 ， 容 易 产 生 错 
误 的 响应 误导 用 户 ， 因 此 高 校 图 书馆 在 使 用 AIGC 应 
用 时 要 加 强人 工 智能 治理 ， 监 控 响应 内 容 变 化 ， 及 时 
人 工 干 预 修正 问题 内 容 ， 增 强 知识 的 可 靠 性 。 
3.2.7 模型 可 扩展 性 

3 个 系统 模型 都 采用 自 注意 力 机 制 ， 因 此 都 具备 良 
好 的 可 扩展 性 。ChatGPT 未 使 用 知识 图 谱 ， 应 用 于 新 
的 领域 需要 提供 海量 的 文本 数据 生成 新 知识 。 文 心 一 
言 拥有 知识 图 谱 ， 只 需 建立 结构 化 知识 库 融 入 学 习 模 
型 中 就 可 扩展 到 新 的 领域 。Bard 在 对 话 数 据 中 增加 了 
知识 训练 ， 目 的 是 为 了 增强 对 话 响应 能 力 ， 使 其 更 接 
近 人 类 语言 ， 因 此 应 用 于 新 领域 需要 将 新 知识 增加 到 
模型 中 。3 个 模型 扩展 的 方式 不 同 ， 而 文 心 一 言 采用 的 
结构 化 知识 库 更 适合 高 校 图 书馆 传统 数据 库 管 理 方式 ， 
减少 管理 成 本 ， 降 低 学 习 曲 线 。 
3.2.8 应 用 可 行 性 

生成 式 对 话 系 统 在 各 领域 中 都 表现 出 较 高 的 价值 。 
ChatGPT 以 优秀 的 自然 语言 理解 和 处 理 能 力 ， 较 高 的 
文本 生成 创作 性 能 表现 出 广阔 前 景 ， 目 前 可 应 用 于 智 
能 客服 、 语 言 翻 译 、 文 本 摘要 、 代 码 生 成 、 文 章 创作 
等 领域 。 文 心 一 言 有 多 模 态 预 训 练 模型 支持 ， 能 够 进 
行 虚拟 图 像 设 计 ， 其 至 达到 以 假 乱 真 的 效果 ， 可 应 用 
于 文学 创作 、 商 业 文案 、 中 文理 解 和 多 模 态 生成 等 领 
域 。Bard 的 量化 评价 机 制 能 够 产生 更 接近 自然 语言 的 
对 话 ， 最 适合 在 智能 客服 领域 中 使 用 ， 将 来 也 可 拓展 
到 其 他 领域 。 高 校 图 书馆 中 ，ChatGPT 更 适合 以 文本 
数据 为 主 的 知识 服务 ， 文 心 一 言 更 适合 多 模 态 内 容 生 
产 为 主 的 文化 服务 ，Bard 更 适合 人 机 对 话 为 主 的 智能 
问答 服务 ， 能 够 充分 发 挥 其 应 用 价值 。 
3.2.9 应 用 局 限 性 

ChatGPT 的 训练 数据 为 2021 年 9 月 以 前 的 互联 网 
历史 数据 ， 且 不 会 更 新 ， 缺 少 实 时 数据 ， 无 法 对 2021 
年 9 月 以 后 发 生 的 事件 产生 正确 响应 。 文 心 一 言 采 用 
互联 网 实时 数据 进行 训练 ， 中 文 数据 训练 较为 显著 ， 
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英文 语 料 数 据 较 少 ， 路 语言 交互 表现 能 力 较 弱 。Bard 
训练 数据 较 少 ， 且 以 对 话 数据 为 主 ， 目 前 不 支持 多 语 
言 对 话 ， 有 时 回答 甚至 会 提供 多 个 答案 供用 户 选择 。3 
个 系统 对 于 文本 生成 的 结果 可 能 会 具有 一 定 偏 见 ， 主 
要 原因 在 于 数据 集 存在 偏差 或 不 完整 ， 同 时 人 工 标 引 
可 能 会 带 入 标 引 者 的 个 人 情感 ， 影 响 最 终生 成 结果 。 
因此 ， 文 心 一 言 尽管 跨 语言 能 力 表现 较 弱 ， 但 高 校 图 书 
馆 可 利用 其 实时 数据 训练 能 力 ， 不 断 更 新 知识 库 ， 增 加 
新 模 态 数据 ， 适 应 高 校 图 书馆 不 断 变 化 的 业务 需求 。 


4 AIGC 在 高 校 图 书馆 应 用 场景 分 析 


高 校 图 书馆 智慧 化 建设 离 不 开 技 术 革 新 和 服务 创 
新 。 目 前 ， 高校 图 书馆 面临 人 员 老 化 、 管 理 滞后 、 读 
者 覆盖 面 不 足 、 技 术 手 段落 后 、 服 务 创新 不 够 等 问题 ， 
AIGC 应 用 于 高 校 图 书馆 ， 能 开启 图 书馆 应 用 新 范式 转 
移 ， 加 快 智慧 图 书馆 建设 进程 ， 创 新 智慧 服务 模式 ， 
增强 图 书馆 的 核心 竞争 力 。 


4.1 财 入 知识 服务 ， 提 高 知识 管理 效能 


知识 服务 需要 提升 知识 解构 和 整合 分 析 效 能 。 
AIGC 具有 大 数据 并 行 处 理 和 泛 化 迁移 学 习 能 力 ， 能 够 
通过 学 习 训练 和 逮 辑 推理 ， 智 能 实现 知识 解构 和 整合 
分 析 。 采 用 ChatGPT 更 适合 高 校 图 书馆 的 知识 服务 场 
景 ， 能 提供 智能 化 知识 管理 方式 ， 提 高 知识 管理 的 工 
作 效 能 。 对 知识 服务 有 以 下 3 个 方面 的 影响 。 

(1) 优化 知识 组 织 体系 ， 增 强 知识 应 用 价值 。 利 
用 模型 的 学 习 推 理 能 力 ， 从 中 央 知 识 库 的 海量 信息 数 
据 中 挖掘 知识 内 在 联系 ， 演 化 新 的 知识 内 容 ， 建 立 自 
我 成 长 的 知识 服务 模式 。 

(2) 改进 知识 管理 模式 ， 提 升 知 识 管理 效能 。 利 
用 模型 的 自然 语言 理解 与 生成 能 力 ， 简 化 复杂 的 知识 
管理 路 径 ， 降 低 人 力 管理 成 本 ， 精 确 识别 用 户 检索 意 
图 ， 构 建 用 户 行为 模式 ， 用 问答 方式 响应 用 户 请 求 ， 
增加 人 工 智能 系统 的 亲和力 。 

(3) 完善 知识 甄选 标准 ， 提 高 知识 资源 质量 。 利 
用 模型 前 馈 网 络 及 奖励 机 制 在 人 工 干预 的 条 件 下 对 知 
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识 进一步 评价 ， 通 过 对 知识 进行 标注 ， 加 强 知识 的 可 
靠 性 和 可 用 性 管理 ， 科 学 判断 信息 的 有 效 性 ， 最 大 限 
度 减 少 知识 融 来 的 偏见 与 歧视 。 


4.2 融合 学 科 服务 ， 赋 能 高 校 学 科 建 设 


学 科 服 务 需要 整合 高 校 教学 资源 和 学 科 知 识 来 提 
高 学 科 服 务 质量 。AIGC 具有 自然 语言 理解 和 预 训练 学 
能 力 ， 能 够 自行 判别 用 户 意图 ， 智 能 生成 自然 语言 
向 应 。 采 用 ChatGPT 更 适合 高 校 图 书馆 的 学 科 服务 场 
景 ，Bard 则 更 适合 参考 咨询 服务 场景 ， 能 深度 提升 学 
科 智 慧 化 服务 能 力 ， 创 新 学 科 服 务 模式 ， 提 高 学 科 服 
务 效 率 。 包 括 以 下 4 个 方面 的 改进 。 

(1) 赋 能 高 校 学 科 建设 ， 辅 助 学 科 热点 研究 。 模 
型 用 中 央 知 识 库 的 海量 数据 追踪 学 科 的 发 展 动向 ， 建 
立 学 科 知识 图 谱 ， 探 求学 科 内 和 跨 学 科 的 研究 关系 ， 
利用 “思维 链 策略 ”进一步 挖掘 学 科 领 域 研究 热点 ， 
聚焦 学 科 领 域 前 沿 ， 把 握 学 科 发 展 趋势 ， 为 高 校 “ 双 
一 流 ” 建 设 提供 有 力 支持 。 

(2) 嵌入 参考 咨询 服务 ， 提 升 读者 服务 体验 。 大 
语言 模型 拥有 逻辑 推理 能 力 ， 在 预 训 练 的 基础 上 发 掘 
知识 的 相关 性 ， 通 过 采集 外 部 信息 不 断 学 习 ， 扩 充 中 
央 知识 库 ， 增 强 自身 的 自然 语言 理解 和 生成 能 力 ， 响 
应 咨询 回复 更 为 客观 ， 有 效 减 少 人 为 主观 意识 对 回复 
内 容 的 影响 。 参 考 咨询 由 人 工 咨询 方式 向 智能 机 器 人 
咨询 方式 转变 ， 可 提供 24 小 时 不 间断 咨询 服务 ， 提 升 
读者 参考 咨询 服务 体验 。 

(3) 融合 学 科 分 析 服 务 平台 ， 实 现 数据 分 析 自 动 
化 。 利 用 模型 语言 理解 生成 能 力 智能 识别 用 户 意 图 ， 
理解 用 户 需 求 ， 在 大 数据 基础 上 深入 分 析 学 科 进 展 ， 
收集 学 科研 究 数据 ， 自 动 生成 学 科 分 析 报 告 ， 提 高 报 
告 撰写 效率 。 

(4) 助力 信息 素养 教育 ,创新 教育 模式 。 在 模型 
的 知识 基础 上 建立 信息 素养 教育 知识 库 ， 将 原来 平面 
的 、 抽 象 的 知识 具体 化 、 立 体 化 ， 提 供 人 工 智 能 生成 
式 对 话 工具 ， 学 生 可 定制 个 性 化 教学 内 容 ， 通 过 自主 
提问 方式 查 缺 补漏 。 全 新 的 智能 教学 工具 ， 让 每 个 学 
生得 到 个 性 化 、 智 能 化 的 信息 素养 教育 。 
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4.3 增强 技术 服务 ， 构 建 图 书馆 新 形象 


技术 服务 需要 增加 信息 推理 和 预测 方法 来 强化 技 
术 监 查 能 力 。AIGC 具有 千 亿 级 超 参 数 训 练 和 拓展 知识 
库 能 力 ， 能 够 通过 现 有 知识 库 推理 信息 流动 向 ， 预 测 
事件 发 展 。 采 用 文 心 一 言 更 适合 高 校 图 书馆 的 技术 服 
务 场景 ， 能 改变 技术 服务 模式 ， 增 强 技术 服务 能 力 ， 
提升 图 书馆 智慧 服务 水 平 。 主 要 有 以 下 3 个 方面 的 新 
举措 。 

(1) 创建 图 书馆 虚拟 形象 ， 营 造 沉 浸 式 体验 环境 。 
利用 模型 知识 库 中 的 多 模 态 数据 信息 ， 借 助 视觉 、 语 
音 、 文 本 生成 算法 自动 化 生成 图 书馆 3D 虚拟 形象 ， 以 
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立 智 能 采 选 服务 平台 ， 实 时 推送 信息 流 至 “ 流 阅 ” 服 
务 ， 实 现 图 书 全 流程 智慧 化 管理 。 第 二 ， 刻 画 读 者 画 
像 ， 精 准 推荐 图 书信 息 。 实 时 跟踪 用 户 信息 请 求 流 ， 
自动 分 析 读者 用 书 、 荐 书 数据 ， 根 据 读 者 行为 刻画 读 
者 画像 ， 利 用 深度 学 习 算 法 和 自然 语言 处 理 技术 进行 
预测 和 个 性 化 推荐 ， 帮 助 读 者 更 精准 获取 符合 其 需求 
的 图 书 资源 ， 提 高 借阅 服务 体验 。 


45 结合 文化 服务 ， 丰 富 文化 建设 内 酒 


文化 服务 需要 自动 生成 内 容 辅 助 文化 创作 宣传 。 
AIGC 具有 多 模 态 数据 处 理 和 内 容 自 动 生成 能 力 ， 能 够 
根据 提示 词 判断 用 户 需 求 ， 创 作 新 内 容 。 采 用 文 心 一 


亲切 的 形象 拉 近 读者 距离 ， 塑 造 元 宇宙 时 代 图 书馆 新 
形象 。 加 速 图 书馆 线 上 演变 ， 打 造 全 新 图 书 阅读 场景 。 

(2) 构建 数字 挛 生 系统 ， 创 新 图 书馆 服务 价值 。 
通过 采集 图 书馆 全 方位 三 维 数据 信息 ， 在 大 量 知识 库 
的 基础 上 ， 快 速 转换 为 实时 参数 化 的 3D 建 模 数 据 ， 高 
效 构建 与 现实 世界 一 致 的 数字 计生 图 书馆 ， 连 通 线 上 
线 下 资源 管理 ,读者 在 线 上 也 能 获得 与 线 下 图 书馆 一 
致 的 沉浸 式 服务 体验 ， 创 造 新 的 服务 价值 。 

(3) 监测 信息 流 安全 状况 ， 辅 助 信息 安全 系统 管 
理 。 利 用 大 语言 模型 预 训练 识别 的 优势 纳入 信息 流 检 
测 ， 运 用 代码 生成 技术 生成 监测 脚本 ， 能 够 更 快 、 更 
准 的 提取 关键 词 ， 检 测 信 息 流 中 的 非法 字符 ， 降 低 关 
键 词 匹配 算法 导致 的 误 识 别 率 ， 提 高 错 敏 词 的 识别 准 
确 率 ， 提 升 信息 安全 管理 能 


4.4 优化 读者 服务 ， 打 造 “ 采 编 流 六 ”一体 
化 平台 


读者 服务 需要 智能 化 管理 平台 提升 读者 访问 体验 。 
AIGC 具有 多 任务 扩展 和 模型 延展 能 力 ， 能 够 根据 “ 采 
编 流 阅 ”需求 扩展 任务 边界 ， 优 化 服务 流程 。 采 用 文 
心 一 言 更 适合 高 校 图 书馆 的 读者 服务 场景 ， 能 实现 知 
能 采 选 和 个 性 化 推荐 ， 提 升 读者 服务 体验 。 可 在 以 下 
两 个 方面 改进 服务 质量 : 第 一 ， 深 度 融 合 智能 技术 ， 
打造 “采编 流 阅 ”一 体 化 服务 。 利 用 模型 强大 的 运算 
能 力 和 海量 的 知识 库 ， 捕 获 并 分 析 读 者 荐 书信 息 ， 建 


言 更 适合 高 校 图 书馆 文化 服务 场景 ， 能 提升 文化 创作 
水 平 ， 拓 展 文化 创作 空间 ， 为 图 书馆 文化 建设 全 面 赋 
能 。 例 如 AI 智能 写作 机 器 人 在 融和 人 大 语言 模型 的 条 件 
下 ， 能 够 快速 生成 新 闻 报 道 ， 减 少 人 工 干 预 ， 提 高 采 
编 效 率 。 利 用 模型 海量 的 多 模 态 数据 ， 智 能 合成 虚拟 
场景 ， 生 成 文化 宣传 设计 ， 实 现 智能 视频 剪辑 ， 提 升 
设计 内 容 价值 ， 为 新 内 容 创作 提供 新 思路 ， 激 发 设计 
灵感 ， 缩 短 设计 周期 ， 加 强 文化 推广 ， 促 进 图 书馆 文 
化 建设 向 智慧 化 全 面 发 展 。 


4.6 赋 能 行政 管理 ， 辅 助 图 书馆 智能 决策 


行政 管理 需要 文本 理解 和 预测 能 力 来 辅助 决策 ， 
提高 行政 管理 效率 。AIGC 具有 自然 语言 理解 和 生成 能 
力 ， 能 够 通过 学 习 训练 预测 内 容 ， 并 有 和 良好 的 任务 扩 
展 性 。 采 用 ChatGPT 更 适合 高 校 图 书馆 的 行政 管理 场 
景 ， 能 建立 决策 优化 预测 模型 ， 用 自然 语言 理解 能 力 
提取 决策 关联 内 容 ， 提 升 模型 的 可 靠 性 ， 为 智能 决策 
提供 更 精准 的 信息 支持 。 同 时 租 入 Office 等 办 公 软 件 ， 
帮助 行政 管理 人 员 智 能 生成 公文 内 容 ， 根 据 行 文 自动 
生成 文章 摘要 并 提出 建议 及 意见 ， 辅 助 行政 管理 人 员 
快速 了 解 行文 中 心思 想 ， 提 高 行政 管理 效率 。 


me 


5 面临 风险 及 对 策 


由 于 大 语言 模型 的 复杂 性 和 不 确定 性 ， 数 据 的 隐 
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私 安 全 和 响应 结果 的 中 立 性 都 成 为 新 的 风险 ， 我 们 需 
要 做 好 准备 面临 以 下 挑战 。 


5.1 伦理 风险 


AIGC 应 用 都 是 在 人 工 数 据 集 上 训练 出 来 。 一 方 
面 ,海量 的 数据 不 可 避免 包含 蘑 些 偏见 和 收视 的 信息 ， 
导致 模型 算法 受到 偏见 和 歧视 的 影响 ;， 另 一 方面 ， 数 
据 的 不 完整 意味 着 不 具有 代表 性 ， 在 训练 过 程 中 可 能 
会 产生 侦 见 。 这 些 都 有 可 能 误导 社会 与 论 ， 造 成 信息 
传播 混乱 ， 严重 的 会 引发 潜在 的 道德 冲突 和 社会 分 虑 。 
应 对 这 一 问题 ， 可 以 深入 检查 训练 数据 ， 监 测 语言 模 
型 的 偏差 ， 建立 去 偏 策略 ， 增 加 多 样 化 训练 、 标 注 和 
评估 方式 ， 制 定 更 公平 、 透 明 的 评价 标准 来 减少 偏见 
和 上 收视 的 影响 。 


5.2 隐私 风险 


AIGC 应 用 在 使 用 过 程 中 会 收集 大 量 数据 进行 演 
化 ， 这 些 数据 中 可 能 包含 用 户 的 隐私 信息 。 一 方面 ， 
人 工 智能 程序 无 法 自动 区 别 这 些 信息 的 隐私 性 ， 在 生 
成 文本 结果 时 会 自动 公开 这 些 信息 ， 导 致 隐私 信息 泄 
Be; 为 一 方面 ， 这 些 数 据 在 共享 过 程 中 可 能 会 遭 到 未 
经 授权 的 使 用 者 攻击 ,访问 到 相关 的 隐私 数据 。 要 解 
决 这 一 问题 ， 可 以 采用 数据 脱 敏 、 匿 名 化 、 去 标识 化 、 
假名 化 、 差 分 隐私 、 同 态 加 密 等 大 数据 隐私 计算 技术 
保护 数据 隐私 性 ， 同 时 加 强 数据 隐私 监管 ， 确 保 数据 
隐私 得 到 充分 保护 。 


5.3 数据 安全 性 


大 语言 模型 面向 公众 开放 ， 不 可 避免 会 受到 网 络 攻 
击 。 目 前 ， 模 型 攻击 、 信 息 注 入 攻击 、 模 型 劫持 攻击 、 
海 绢 样本 攻击 已 成 为 AIGC 大 语言 模型 面临 的 重要 安全 
问题 。 面 对 这 些 问题 ， 可 以 加 强 数 据 安 全 管理 ， 采 取 数 
据 加 密 和 访问 权限 控制 技术 最 大 限度 保障 数据 安全 性 ， 
并 通过 建立 相应 法 律 法 规 ， 确 保 数 据 安全 性 得 到 保护 。 


5.4 虚假 知识 泛滥 


由 于 大 语言 模型 的 复杂 性 和 不 确定 性 ， 以 及 训练 
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数据 集 可 能 会 存在 一 些 虚假 、 过 时 的 知识 ， 导 致 生成 
文本 会 包括 一 些 模 型 认为 是 正确 但 实际 上 是 虚假 的 信 
息 ， 可 能 会 对 用 户 产生 误导 。 面 对 这 一 问题 ， 可 以 加 
强 虚假 信息 的 审查 和 评估 ， 对 这 些 内 容 进行 人 工 标注 ， 
并 通过 增加 多 样 化 训练 数据 的 手段 减少 虚假 知识 的 影 
啊 。 


6 结 语 


高 校 图 书馆 采用 AIGC 大 语言 模型 处 理 信息 数据 ， 
能 够 在 系统 架构 层面 拓展 信息 处 理 能 力 ， 提 升 信息 处 
理 效 能 。ChatGPT 具有 更 强 的 自然 语言 处 理 能 力 ， 适 
用 于 高 校 图 书馆 知识 服务 、 学 科 服务 和 行政 管理 场景 ， 
辅助 资源 整合 及 智能 决策 。 文 心 一 言 具有 多 模 态 内 容 
生成 和 理解 能 力 ， 适 用 于 高 校 图 书馆 技术 服务 、 读 者 
服务 和 文化 服务 场景 ， 辅 助 内 容 创作 及 信息 预测 分 析 。 
Bard 具有 增强 人 机 对 话 能 力 ， 适 用 于 高 校 图 书馆 参考 
咨询 服务 场景 ， 辅 助 24 小 时 智能 问答 。 

随 着 AIGC 内 容 创作 方式 进一步 发 展 ， 高 校 图 书 
馆 融 合 AIGC 的 自然 语言 理解 生成 能 力 ， 能 拓展 多 元 
化 应 用 场景 ， 构 建 以 内 容 创作 和 智慧 服务 为 核心 的 图 
书馆 生态 体系 ， 打 造 元 宇宙 沉浸 式 图 书馆 ， 创 新 多 维 
服务 模式 ， 优 化 业务 服务 环境 ， 辅 助 行政 管理 决策 ， 
提升 智慧 化 服务 水 平 。 
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Abstract: [Purpose/Significance] Artificial intelligence generated content (AIGC)'s content creation method has brought about a new 
revolution to the field of library and information science (LIS). Currently, the related research is mainly based on AIGC and ChatGPT, 
while ERNIE bot and Bard are less studied. Comparative analysis of the advantages and disadvantages of the AIGC large language 
models, discussion of the operating mechanism of AIGC, and in-depth research on application solutions in the context of university 
libraries provide new ideas for AIGC applications in smart libraries. [Method/Process] Taking the three AIGC applications of ChatGPT, 
ERNIE bot and Bard as examples, starting from the Transformer model, and on the basis of in-depth analysis of the basic principles of 
the large language model, the comparative analysis method is used to conduct a horizontal comparison of these three applications. The 
research summarizes the six common features of AIGC's large language model, and points out that it can be used in improving the work 
efficiency of university libraries. This paper explains and identifies nine different characteristics of the AIGC large language model, and 
points out how to choose three applications in university libraries. According to the characteristics of each application, six 
scenarios-based application modes of university libraries and the advantages of AIGC applications in university libraries are pointed out. 
A discussion is provided on four potential risks that may be faced by libraries in using AIGC large language models, and solutions are 
proposed to reduce risks, providing a reference for university libraries to choose AIGC applications. [Results/Conclusions] ChatGPT 
focuses on natural language understanding and content generation, and has more advantages in the ability of natural language 
understanding, task applicability and cross-language transfer, and is more suitable for resource integration and decision-making 
assistance in the context of knowledge services, subject services and administrative management. ERNIE bot has hundreds of billions of 
super-training parameters, and it can generate multi-modal content including text, pictures and voices. It has more advantages in learning 
training, model expansion and Chinese comprehension, and is more suitable for optimizing services and assisting creation in the context 
of reader services, technical services and cultural services in university libraries. By comparison, Bard focuses on human-machine 
dialogue data processing, it can use natural language to communicate with people, and it is more suitable for providing 24-hour 
intelligent customer service, assisting subject consultation and knowledge Q&A in the context of reference consultation in university 
libraries. With the application of AIGC, although university libraries will face ethical risks, privacy risks, data security, and the 
proliferation of false knowledge, as long as artificial intelligence data governance is strengthened, in the future, university libraries will 
integrate the natural language understanding and generation capabilities of AIGC large language models that can expand diversified 
application scenarios, innovate multi-dimensional service models, optimize the business service environment, assist administrative 
decision-making, and improve the level of intelligent services. 
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